#entrenamiento offline-online

Q2RL: Aprendizaje por Refuerzo en Robótica desde Clonación de Comportamiento

Aprende cómo Q2RL extrae Q-values de clonación de comportamiento para mejorar robots con RL, logrando éxito del 100% en manipulación.